#!/usr/bin/env python
# coding: utf-8

# ## 2.2.1 Series

# In[6]:


import pandas as pd


# In[14]:


s=pd.Series(data=[100,'a',{'dicl':5}],
index = pd.Index(['id1',20,'third'],name='my_idx'),
dtype='object',
name='my_name')
s


# In[23]:


s1 = pd.Series(
    data=[67,78,76],
    index = pd.Index(['语文','数学','英语'],name='学科')
)


# In[24]:


s1


# In[25]:


s1.values


# In[27]:


s1.index


# In[29]:


s2 = pd.Series(
    data = [23,45,78],
)


# In[31]:


s2


# In[33]:


s2[0]


# ## DataFrame

# ### ①

# In[35]:


data = [
    [1,'a',1.2],
    [2,'b',2.2],
    [3,'c',3.2]
]


# In[36]:


df = pd.DataFrame(
data=data,
    index = ['row_0','row_1','row_2'],
    columns=['col_0','col_1','col_2']
)


# In[37]:


df


# ### ②

# In[38]:


data = {
    'col_0':[1,2,3],
    'col_1':['a','b','c'],
    'col_2':[1.2,2.2,3.2]
}


# In[39]:


df = pd.DataFrame(
    data = data,
    index = ['row_0','row_1','row_2']
)


# In[40]:


df


# ## DataFrame 取值的一般方法

# In[41]:


df['col_0']


# In[42]:


df[['col_0','col_2']]


# In[43]:


df.iloc[1:3]


# * 课后练习（参考pandas cheat sheet)
#     1. iloc
#     2. loc
#     3. iat
#     4. at
#    

# ## 常用基本函数
# 1. 汇总函数
# 2. 特征统计函数
# 3. 唯一值函数
# 4. 替换函数
# 5. 排序函数

# In[45]:


df= pd.read_csv('C:/Users/pc/Desktop/data_analysis-master/week02/data/learn_pandas.csv')


# In[46]:


df


# In[47]:


df.columns


# In[49]:


df[[ 'Name', 'Gender', 'Height', 'Weight']]


# In[50]:


df.head()


# In[51]:


df.tail()


# In[52]:


df.info()


# In[53]:


df.describe()


# ## 特征统计函数

# In[54]:


df_demo = df[['Height','Weight']]
df_demo


# In[56]:


df_demo.mean()


# In[57]:


df_demo.count()


# In[59]:


df_demo.idxmax()


# ## 唯一值函数

# In[60]:


df['School'].value_counts()


# In[61]:


df


# ## 实践一
# * 请计算：所有不同学校的身高、体重的均值、最大值、最小值
# * 请计算：所有不同学校的男女比例情况
# * 统计：不同学校的Grade的数量

# In[62]:


df['School'].unique()


# * query()

# In[68]:


df.query("School = = 'Shanghai Jiao Tong University'")


# In[ ]:





# In[ ]:




